- SYNTHÈSE CHIMIQUE ASSISTÉE PAR ORDINATEUR
- SYNTHÈSE CHIMIQUE ASSISTÉE PAR ORDINATEUREntre 1940 et 1985, la pharmacopée américaine s’est enrichie de cinq cents structures actives nouvelles; de nouveaux colorants, pesticides, fongicides, cosmétiques, parfums, etc., ont été découverts. D’autre part, l’extraction des molécules élaborées par les organismes vivants marins ou terrestres fournit chaque année de nouvelles substances naturelles dont les structures sont parfois de véritables défis au talent des chimistes adeptes de la discipline dite des «synthèses totales». L’objectif de cette dernière est de reconstruire, à partir de composés chimiques simples, ces structures élaborées.Si le prix de revient de la synthèse des composés de la première classe est généralement abordable, celui de la majorité de ceux de la seconde décourage pour l’heure l’exploitation commerciale: la vitamine B12, synthétisée en 1972 grâce aux efforts conjugués des équipes de Robert B. Woodward et de A. Eschenmoser, a nécessité trois cents années-chercheur de travail. Ce nombre peut paraître élevé dans une optique de développement commercial; il est en fait dérisoire si on le situe dans la lignée des grandes aventures humaines: construction des pyramides, des cathédrales ou conquête de l’espace. Tout comme cette dernière qui, tendue vers des objectifs précis, a suscité nombre de découvertes technologiques importantes, la synthèse de la vitamine B12 a entraîné la formulation de nouvelles lois de réactivité de portée très générale.Le problème posé au chimiste engagé dans la synthèse d’un composé s’énonce: «Soit un composé de structure connue; quelle réaction ou quelle suite de réactions sont envisageables pour l’obtenir à partir de molécules plus simples et/ou plus accessibles? Parmi toutes les voies d’accès, quelles sont celles qui ont le plus de chances d’aboutir compte tenu des contraintes structurales et économiques?» La première question conduit à un inventaire des chemins synthétiques possibles, la seconde à l’évaluation comparée des chemins inventoriés.Bien avant que l’ordinateur ne soit entré dans les mœurs, le chimiste procédait, en principe, à l’analyse de ce problème en répondant successivement ou itérativement aux deux questions précédentes. Dès 1966, Jacques-Émile Dubois dressait le bilan des variations de chemin d’accès aux cétones en fonction de modifications structurales progressives. Néanmoins, l’exemple du squelette benzomorphanique (fig. 1) explique pourquoi on a fait appel à l’assistance de l’ordinateur. Certains dérivés N-méthylés du benzomorphane possèdent d’excellentes propriétés analgésiques; toutefois, leur utilisation peut entraîner chez le patient un phénomène de dépendance. Les recherches en chimiothérapie du soulagement de la douleur ont suscité la synthèse de nombreux composés dérivés de ce squelette de base dans l’espoir d’obtenir des analgésiques plus puissants et/ou sans effets secondaires. L’arbre de synthèse (fig. 1) engendré par le programme S.O.S. (tabl. 1) utilisé en version interactive compte huit précurseurs (1, 2, 3, 4, 5, 6, 7, 8) de premier rang qui conduisent au squelette benzomorphanique 0 (dit molécule cible ou cible ). Pour d’évidentes raisons de présentation graphique, cet arbre ne comprend plus ensuite pour chacun des précurseurs de deuxième, de troisième, de n -ième rang qu’un ou au plus deux chemins dérivés. En fait, l’arbre engendré par le programme est beaucoup plus «touffu». Théoriquement, le nombre de possibilités est k n ; n est le nombre moyen d’étapes (étape: réaction qui lie verticalement la cible et un précurseur, ou deux précurseurs de rangs successifs entre eux) entre la molécule cible et les précurseurs commerciaux; k est le nombre moyen de précurseurs de rang (n + 1) directement liés au précurseur de rang n . Comme chacun des précurseurs engendre en moyenne au moins trois précurseurs de rang supérieur et comme le nombre n d’étapes à franchir pour aboutir aux produits commerciaux est environ de huit, le nombre de possibilités est 38 = 6 561. Ce nombre est faible si on le compare à celui qui aurait été obtenu par la vitamine B12 mais très fort en regard de celui qui est associé à la synthèse de médicaments simples tels que l’aspirine. La variété des composés chimiques est telle que le spectre des complexités d’arbres de synthèse couvre toute la gamme qui va de quatre ou cinq possibilités à 1010 possibilités théoriques de synthèse. À la différence du chimiste, l’ordinateur effectue sans fatigue les travaux d’inventaire. Cela explique que les chercheurs américains Elias J. Corey et W. Todd Wipke aient tenté l’aventure de la synthèse organique assistée par ordinateur. La publication relatant leurs premiers succès date de 1969; depuis, les chercheurs américains ont fait école. Le tableau 1 rassemble les caractéristiques de quelques-uns des programmes réalisés.Inventaire des chemins de synthèseL’élaboration de tout programme de synthèse assistée par ordinateur suppose la résolution des problèmes spécifiques suivants:– représentation en langage binaire de la structure de la cible et de ses précurseurs; cette représentation ne peut être uniquement topologique;– représentation en langage binaire de toutes les réactions de synthèse et inventaire de celles qui devront être emmagasinées en mémoire d’ordinateur;– situation des objectifs du programme entre les deux pôles extrêmes: programme de simulation de synthèse à discrimination totalement automatique et programme d’inventaire de chemins de synthèse laissant au chimiste utilisateur la responsabilité totale de l’évaluation des propositions;– programmation pratique du type de discrimination retenu.Le nombre de méthodes différentes de représentation de la structure chimique en langage binaire avoisine la dizaine. Le principe des tables de connectivité illustre sur l’exemple du benzomorphane l’allure que peuvent prendre ces représentations (tabl. 2). Cette table indique seulement la nature des atomes (C, O, N) et leurs interconnexions liantes relatives en précisant s’il s’agit de liaisons simples, doubles ou triples. À l’heure actuelle, le chimiste peut être totalement déchargé du souci de la représentation de la molécule: il dessine la cible sur un écran cathodique qui transcrit automatiquement le message en langage binaire.L’ordinateur connaît maintenant la structure de la molécule cible. Il doit alors faire l’inventaire des possibilités de synthèse. S’il se limitait à la seule description topologique et fonctionnait sans interruption du moment où le problème lui est posé à celui où il aurait fourni toutes les solutions, il effectuerait les opérations suivantes:– reconnaître une liaison, par exemple la liaison 1 漣2 du benzomorphane: c’est une liaison C 漣C;– chercher dans le fichier «réactions de synthèse» celles qui permettent de former une liaison C 漣C;– représenter graphiquement chacun des précurseurs pour lesquels l’application de chacune des réactions trouvées conduit à la molécule cible;– passer à la liaison 2 漣3: c’est une liaison C 漣N;– chercher dans le fichier les réactions «formation du lien C 漣N»;– représenter graphiquement chacun des précurseurs... et ainsi de suite jusqu’à ce que toutes les liaisons de la cible aient été tour à tour reconnues et exploitées; l’inventaire des précurseurs de premier rang est alors terminé; chaque liaison du benzomorphane a donné naissance à au moins un précurseur;– inspecter chacun des précurseurs de premier rang comme s’il était maintenant la cible; cette manière de procéder est dite rétrosynthétique puisque l’ordinateur opère en sens inverse du schéma réactionnel expérimental (synthétique ) où, partant de produits commerciaux, on atteint la cible;– comparer chaque précurseur engendré avec le stock de produits commerciaux conservé dans un fichier spécial; si un précurseur s’avère être un produit commercial, ne plus le considérer comme cible dans la suite récurrente d’opérations rétrosynthétiques; si le précurseur n’est pas commercial, le conserver en mémoire pour l’examiner comme une cible lorsque l’inspection des précurseurs de premier rang sera terminée;– passer ainsi en revue chacun des chemins possibles de synthèse jusqu’à reconstruction totale de l’arbre qui lie la cible aux produits commerciaux.La discriminationLes étapes précédentes correspondent à un programme non interactif et sans discrimination . Il est dit non interactif car, une fois la cible dessinée, le chimiste n’intervient plus jusqu’à ce que le programme ait complètement traité le problème. Il est dit sans discrimination car il explore les différentes possibilités de synthèse sur la seule base de sa perception topologique de la molécule, sans chercher à évaluer chacune des voies qu’il a découvertes. Aucun programme réel ne fonctionne selon ce scénario car le chimiste serait enseveli sous une énorme quantité de chemins de synthèses et devrait trier les propositions pour ne conserver que celles qui lui semblent réalisables. Le taux élevé de chemins chimiquement absurdes lui montrerait qu’il faut absolument introduire une discrimination s’il veut éviter le gaspillage de son temps et du temps-machine. Cette discrimination repose sur deux types d’informations: d’une part, les données structurales qualitatives et quantitatives, d’autre part, les contraintes économiques.Toutes les nuances existent entre l’automatisation complète de la discrimination et, au contraire, l’interaction avec le chimiste à chaque étape. À la différence de l’ordinateur, le chimiste perçoit d’emblée la cible avec une discrimination implicite qui est capitale car elle peut agir dès les précurseurs de premier rang. Dans la description topologique fournie par la seule table de connectivité, une partie de l’information disparaît. Cette description est en effet parfaitement neutre car elle définit l’ensemble des atomes sans en particulariser aucun. Le chimiste sait par contre «caricaturer» la cible: chacune de ces caricatures porte au premier plan un groupe donné d’atomes et rejette provisoirement dans l’ombre les autres; chaque caricature suggère une discrimination structurale. Ce type de discrimination connaît une gradation très nette des difficultés.Ainsi, tout chimiste appréhende au premier coup d’œil la présence du cycle benzénique (atomes 6 , 7, 8, 9, 10, 10 ) et celle de la fonction OH dans le benzomorphane. Il percevrait de même immédiatement la présence de tout autre groupement fonctionnel (acide, nitrile, ester, etc.). Ce degré de perception a été intégré dans la plupart des programmes, qui se comportent à ce niveau comme le chimiste, et la discrimination automatique qui en découle est importante. Ainsi, lorsque le programme «reconnaît» la présence du cycle benzénique, il élague dès le départ les branches de l’arbre de synthèse qu’il aurait normalement proposées en consultant les fichiers de formation de liaisons C=C et C 漣C pour la partie 6 , 7, 8, 9, 10, 10 de la cible. De même, lorsque le programme relève dans une structure la présence simultanée d’une double liaison et d’un carbonyle, il sait que s’il propose une réaction d’hydrogénation de l’insaturation, il lui faudra auparavant protéger la fonction carbonyle. L’ordre logique des protections et déprotections de fonctions constitue en soi dans certains programmes tout un groupe de décisions discriminantes.Enseigner au programme comment tenir compte de la présence de l’environnement électronique et stérique lors d’une réaction fait grimper d’un degré dans l’échelle des difficultés de discrimination. Ainsi, la réaction qui conduit du précurseur 5 à la cible met en jeu la cyclisation acidocatalysée de la tétrahydropyridine. La force motrice de cette réaction est la neutralisation, par deux électrons du sextet benzénique, de la charge positive créée lorsque la double liaison de l’hétérocycle fixe un proton; cette force motrice augmente lorsque un ou plusieurs groupements électrodonneurs substituent le cycle benzénique. Cette donnée de réactivité peut être intégrée au programme qui «notera» alors sévèrement le chemin de synthèse 50 si le cycle benzénique porte des substituants électroattracteurs.La représentation du benzomorphane consignée dans la figure 1 ne tient aucun compte de la stéréochimie de la molécule, donnée pourtant importante, car les différents stéréo-isomères du benzomorphane n’ont pas les mêmes propriétés pharmacodynamiques. La réaction 50 produit un mélange de deux stéréo-isomères si la double liaison de l’hétérocycle est disubstituée (fig. 2). Lorsque les substituants sont des groupements alkyle, l’expérience montre que la réaction fournit l’isomère cis de façon prépondérante. La discrimination stéréochimique doit, pour chaque étape qui met en jeu des stéréo-isomères, reconnaître et noter positivement la voie qui conduit stéréospécifiquement au stéréo-isomère désiré. Seuls les programmes les plus performants (tabl. 1) savent partiellement effectuer ce type de discrimination. Encore faut-il souligner que leur fiabilité est assez restreinte. L’exemple de la réaction 50 (fig. 2) aide à comprendre pourquoi; si, dans le précurseur 5, le groupement phényle plutôt que le groupement méthyle substitue le carbone qui deviendra C6 dans le benzomorphane, la stéréochimie de la réaction est totalement inversée. Cette inversion inattendue illustre une des limites actuelles de la simulation de synthèse par ordinateur. Les lois de la réactivité chimique sont encore loin d’être totalement énoncées et, par conséquent, la prédiction infaillible des produits d’une réaction est encore un leurre, tout particulièrement au niveau stéréochimique. Aussi faut-il admettre, dès le moment de la conception, qu’une synthèse peut comporter des étapes d’aventure. Pour celles-ci, le chimiste se risque sans avoir d’idée très claire de ce qu’il va recueillir en fin de réaction. La simulation totale d’une synthèse complexe est pour l’heure souvent impossible; cela rend indispensable la démarche itérative: chimisteprogrammechimiste (première boucle), chimisteprogrammechimiste (deuxième boucle) et ainsi de suite.Le degré ultime de la discrimination est atteint avec la perception globale de certains synthons ; un synthon est une portion de molécule qui évoque un précurseur accessible et suggère par suite certaines voies de synthèse. Si tout chimiste reconnaît les cycles aromatiques, les groupements volumineux ou les groupements électroattracteurs, moins nombreux déjà sont ceux qui peuvent préjuger de la stéréospécificité d’une réaction avec une bonne fiabilité; ce nombre s’amenuise encore si l’on passe à la perception de certains synthons. Ainsi, le programme S.O.S. a proposé la voie de synthèse 22122 après qu’on lui eut «enseigné» que le bloc N 漣C(O)R pouvait parfois être engendré par une réaction de réarrangement de Beckmann. D’autres synthons semblent relever d’une aptitude à la reconnaissance de forme particulièrement développée chez les grands maîtres de la synthèse totale. Cette reconnaissance de forme est parfois le résultat de la perception d’une quasi-symétrie difficilement programmable; par exemple, la vision de la formule «benzomorphane substitué en 11 par un groupement exo et en 8 par un groupement metoxy» a suggéré directement le produit de départ ci-dessous:Au cours de cette démarche, tout se passe comme si le cerveau humain était capable de «remonter» presque instantanément une des branches de l’arbre de synthèse en négligeant toutes les autres. Le mécanisme est comparable à celui qui caractérise le jeu de quelques grands joueurs d’échecs qui perçoivent l’échiquier, neutre pour un profane, habité de lignes globales de force. E. J. Corey essaie également d’analyser ce processus au niveau de certaines synthèses totales afin d’intégrer, au moins en partie, cette aptitude discriminante dans son programme.Outre ces facteurs de discrimination structurale, il faut considérer les facteurs de discrimination économique. Le premier, qu’illustre la figure 1, est la nécessité de sélectionner les voies à petit nombre d’étapes, voies si possible convergentes. Si le rendement moyen de chaque réaction est de 90 p. 100, le rendement global de la synthèse en trois étapes sera de 73 p. 100 et tombera à 21 p. 100 si la synthèse nécessite quinze étapes. À la différence des organismes vivants le chimiste réalise assez peu souvent des réactions avec des rendements de 100 p. 100. Chaque étape qui éloigne du produit commercial voit donc s’amenuiser la contenance des ballons réactionnels. Par suite, l’échec qui sanctionnerait éventuellement l’une des dernières étapes prend des allures de catastrophe. Dans une synthèse convergente , la molécule cible ou l’un des précurseurs de faible rang résulte de la réaction de deux synthons de taille voisine. Dans ces conditions, si l’une des étapes de synthèse se montre récalcitrante, ce n’est pas toute la synthèse de la cible qui est remise en cause mais, en quelque sorte, la «moitié» seulement. Cela explique que la discrimination favorise les chemins de synthèse de type convergent.Une autre discrimination optionnelle résulte des «diagrammes de fréquence d’utilisation» des réactions. Un grand nombre de réactions sont connues et certains programmes s’articulent autour d’un fichier de quatre cents réactions (tabl. 1). Néanmoins, pour une famille de structures, certaines réactions sont beaucoup plus utilisées que d’autres. En admettant que les réactions les plus fréquemment citées sont celles qui ont conduit aux meilleurs résultats, la discrimination fondée sur les diagrammes de fréquence d’utilisation devrait permettre de sélectionner les chemins les plus fiables. Le danger d’une telle discrimination découle évidemment de ce qu’elle peut passer sous silence le réarrangement, peu connu, qui aurait précisément permis d’accéder rapidement à la cible. La chimie des prostaglandines abonde en exemples de ce type. Ce vice n’est pas rédhibitoire pour le programme dans son ensemble car on peut très bien réaliser un programme qui, selon l’objectif poursuivi, «appelle» le fichier des réactions classiques ou celui de ces mêmes réactions accompagnées des réactions «exotiques».G. J. Powers a tenté d’utiliser aussi comme facteur de discrimination le coût des produits commerciaux de départ. Toutefois, cette discrimination perd toute signification pour peu qu’un nombre suffisant d’étapes sépare la cible des produits de départ. D’autres contraintes économiques ont leur importance, telles que le coût des séparations fondées sur l’évaluation des produits secondaires formés dans chacune des réactions de synthèse. On aborde là un domaine de discrimination qui, malgré son importance économique indéniable, n’est applicable qu’aux arbres de synthèse de taille très réduite. Au niveau économique, la plupart des programmes sont en fait encore interactifs: ils laissent le soin au chimiste de choisir la voie qui lui semble le mieux tenir compte des diverses contraintes dont il a connaissance. Libre à lui d’ailleurs de se constituer un fichier parallèle s’il désire une assistance informatique pour ce choix.L’ensemble des types de discrimination que nous venons de voir montre clairement que la deuxième question du problème posé en introduction est de très loin plus délicate à programmer que la première. On retrouve ici la structure multiforme et touffue des problèmes qui se sont posés aux administrateurs désireux d’informatiser l’avancement des carrières dans certaines grandes entreprises. Il semblerait que pour la reconnaissance des formes et au niveau des nuances, l’homme soit encore bien plus performant que les programmes en cours. Néanmoins, l’avantage certain des essais poussés de discrimination dans le domaine de la synthèse organique est de mettre en lumière les processus qui président au choix d’un chemin réactionnel.Réalisations et limites des programmesL’arbre consigné dans la figure 1 ne contient que les propositions les plus représentatives du programme S.O.S. Les formules sont celles qui sont effectivement dessinées par le traceur de courbes, ce qui explique quelques imperfections mineures (nitrile de 211111 très voisin d’un C = N, pyridine «cyclohexanique bateau»...). La comparaison des précurseurs proposés par l’ordinateur avec les grandes voies découvertes expérimentalement illustre les possibilités de la synthèse assistée par ordinateur tout en indiquant ses limites.La voie 11110 est celle qui a permis à Everett L. May, en 1968, de préparer le N-méthylbenzomorphane non substitué. Les voies plus classiques de synthèse ne permettaient en effet pas d’obtenir le composé le plus simple de la famille avec des rendements acceptables. En principe, une bonne discrimination devrait permettre de prévoir les limites d’une synthèse lorsque le squelette de base subit des modifications structurales. Nous avons vu que, pour l’instant, le «front» de ce type de discrimination reste encore très irrégulier: si l’on sait bien quelles méthodes sont adaptées à la préparation d’un type donné de cétone encombrée, on ignore encore le champ structural de nombre de nouvelles réactions organométalliques.Le principe des voies 121111110 et 1212111110 est analogue à la suite réactionnelle proposée en 1955 par E. L. May pour remplacer la première voie d’accès proposée en 1947 par J. A. Barltrop (61110). Cette dernière compte pourtant moins d’étapes mais les mauvais rendements des étapes 6111611 et 60 grèvent lourdement le rendement global. Aucun programme de l’époque n’aurait été capable de prédire que la voie de E. L. May était préférable à celle de J. A. Barltrop. Il fallait essayer pour savoir.Le programme S.O.S. a proposé la voie 211110 qui n’est pas encore décrite dans la littérature scientifique. Pour qu’elle soit expérimentalement envisageable, il faudrait l’aménager en tenant compte de la nécessité de protéger la fonction carbonyle dans certaines étapes et, d’autre part, d’activer le groupement CH3 de l’acétonitrile dans l’étape 211112111.Nous avons vu que la voie 2211110 mettait en jeu la transposition de Beckmann dans sa phase clé. Signalons que, à l’époque où l’ordinateur proposa cette voie (1972), elle n’était pas encore décrite dans la littérature scientifique; il fallut attendre 1975 pour que S. T. Sallay l’explore avec succès.J. R. Gegy a utilisé en 1967 la voie décrite en 3111110 pour préparer les 6-arylbenzomorphanes.La réaction 414 est la réaction clé de la voie 411111110; c’est une réaction d’hétérocyclisation radicalaire découverte plus tard. En l’absence de cette réaction dans le fichier, le programme n’aurait pas proposé cette voie de synthèse explorée en 1975 par J. M. Surzur. En revanche, une fois intégrée au fichier, elle permettra, pour toute nouvelle cible, d’envisager l’«ouverture» associée à ce nouveau schéma synthétique. Cette branche de l’arbre illustre donc l’importance capitale de la mise à jour constante des fichiers de réactions. Un informaticien pur ne peut efficacement exercer cette fonction: une équipe de programmation de synthèse assistée doit donc compter au moins un bon chimiste. Signalons aussi que la mise au point expérimentale de ce nouveau chemin de synthèse et son application à la préparation de six dérivés benzomorphaniques ont occupé un chercheur (B. Raynier) pendant deux ans. Cette donnée montre que lorsqu’un chimiste a conçu une nouvelle synthèse sur le papier, bien du chemin lui reste encore à parcourir pour vérifier si son idée était bonne. Cela plaide fortement en faveur d’une utilisation intensive de programmes de synthèse assistée ou, au moins, d’un investissement de temps plus important sur la phase «conception du chemin de synthèse». Un mois investi sur la conception pèse encore bien peu en regard des vingt mois nécessaires à la réalisation expérimentale.La synthèse de Grewe (1948) ouvre la meilleure voie vers la série des trialkyl-3, 6, 11 benzomorphanes connus pour leurs excellentes vertus analgésiques. Le programme en a retrouvé le principe (51110) et nous en avons précédemment discuté les implications stéréochimiques.Un brevet couvre depuis 1974 le principe de la synthèse 71110 proposée par l’ordinateur. Le schéma 810 retrouve la voie dite des pipéridinols découverte par l’équipe de E. L. May.Soulignons encore une fois un trait des programmes de synthèse assistée: le choix judicieux des réactions retenues dans les fichiers conditionne les performances réalisées ensuite. Il n’est évidemment pas question d’utiliser un fichier qui contiendrait les variantes de toutes les réactions que les chimistes ont découvertes: le nombre de solutions proposées et donc le coût de chaque interrogation deviendraient alors prohibitifs. Le traitement de cet exemple montre qu’un programme unique visant à traiter exhaustivement toute cible est hors de portée. En revanche, on peut envisager un programme «tronc commun» qui, selon la famille à laquelle appartient la cible et selon l’objectif poursuivi, appelle de façon sélective des fichiers de réaction et des sous-programmes de discrimination différemment orientés et approfondis.Analyse de l’arbre synthétique dans le sens directDans les applications précédemment décrites, le point de départ était la molécule-cible que l’on cherche à synthétiser et, partant de cette cible, on construisait progressivement l’arbre de synthèse. Cette démarche est dite rétrosynthétique . Une des contraintes les plus importantes associées au développement de la chimie fine est la production, au cours de certains procédés de synthèse, de produits secondaires difficiles à séparer et/ou polluants. L’approche synthétique permet de s’attaquer à ce problème. Ce que l’on enseigne alors à l’ordinateur, c’est l’information et la logique qui lui permettront de répondre à la question: si je mélange les réactifs A et B sous telles et telles conditions, quels produits ou mélanges de produits puis-je attendre? La logique qui sous-tend cette approche est l’application des lois qui sont associées aux mécanismes réactionnels. De cette manière, l’ordinateur est ainsi à même d’avertir l’organicien que telle réaction pourrait engendrer tels produits secondaires. Il peut aussi avertir le chimiste qui aborde l’étude analytique d’un mélange complexe dont il connaît l’origine chimique (chimie agroalimentaire) qu’il ferait bien de chercher à identifier tels et tels produits dans son mélange. Enfin, sur un plan plus fondamental, l’ordinateur peut dresser un inventaire des mécanismes possibles pour une transformation chimique dont seuls réactifs et produits sont connus. Tout comme pour l’approche rétrosynthétique, divers degrés d’élaboration sont envisageables dans cette direction.Créativité des programmesLe type de solution recherchée par le chimiste dépend beaucoup de la complexité structurale de la cible, essentiellement en raison de la relation de type k n .Pour une cible de petite taille, on peut utiliser sans crainte un programme articulé sur un fichier de réactions très riche (réarrangement, photochimie, synthèses biologiques, utilisation poussée de complexes inorganiques, mécanismes réactionnels). Même si ce programme propose une centaine de voies de synthèse au chimiste, celui-ci peut accepter d’investir le temps nécessaire à leur examen critique. Dans cette situation, la «créativité» de l’ordinateur provient simplement de ce qu’il transporte des acquisitions d’un certain domaine de recherche à un domaine relativement éloigné: un chercheur spécialisé dans la synthèse d’alcaloïdes peut ignorer les possibilités synthétiques ouvertes par une réaction catalytique inorganique.Pour des cibles de taille importante, le fichier exhaustif de réactions engendrerait beaucoup trop de solutions. L’innovation en ce domaine découle plutôt de l’approche de Corey, axée sur la recherche de nouveaux synthons. Celle-ci passe par l’analyse critique des stratégies de synthèses totales déjà réalisées. De cette analyse découlent des stratégies qui, découvertes à propos d’une structure donnée, sont généralisables à d’autres édifices moléculaires. L’ordinateur peut par exemple favoriser nettement tout chemin réactionnel qui utilise la réaction de Diels-Alder. Dans cette optique, c’est tout un ensemble de séquences réactionnelles (stratégie) qui est favorisé en bloc et l’innovation résulte de transferts de stratégie d’un domaine à un autre.Un dernier type de créativité, indirecte, associée à l’utilisation de programmes de synthèse, mérite d’être signalé. Lors de l’étape de réflexion qui précède le choix des réactions à retenir pour le fichier, J. B. Hendrickson a découvert que certains principes réactionnels utilisés depuis fort longtemps étaient incomplètement exploités. C’est ainsi que le regroupement et l’organisation des réactions péricycliques à six électrons, pourtant connues depuis Diels et Alder (1926), a montré que des dizaines de schémas synthétiques dérivés du même principe étaient restés totalement inexplorés. La créativité résulte ici du dépistage de domaines de réactivité «oubliés» au cours de l’avancement du «front chimique».Apport de la micro-informatiqueNous verrons que, tout comme la chimie théorique, la synthèse assistée par ordinateur peut osciller entre deux pôles: l’un simplificateur, le second visant à l’exhaustivité d’information et de discrimination. Ces deux approches ont un rôle complémentaire à jouer et c’est au chimiste qu’il convient de décider laquelle adopter dans une situation donnée. Nous avons jusqu’à présent traité essentiellement du second; l’avènement de la micro-informatique a fortement dynamisé le premier. À condition d’accepter certaines simplifications au niveau du traitement de la discrimination et en sélectionnant la nature des réactions introduites dans le fichier de base, on peut réaliser des programmes adaptables sur la nouvelle génération de micro-ordinateurs. C’est une innovation de taille: la synthèse assitée par ordinateur risquait, au fur et à mesure de son élaboration, de devenir un outil essentiellement réservé aux firmes de taille importante. La micro-informatique permet de faire entrer cet outil dans les entreprises de taille moyenne. La conséquence est double: d’une part, le chimiste lui-même peut moduler le profil de son outil (en y intégrant les réactions qui l’intéressent plus spécifiquement par exemple), d’autre part, prenant l’habitude d’utiliser directement la micro-informatique, il domine mieux l’outil informatique et évalue plus objectivement ce qu’il peut attendre de l’approche «macro» informatique lorsque le besoin impérieux s’en fait sentir. Il est certain que le développement des programmes en micro-informatique dans le domaine de la synthèse chimique permettra d’articuler harmonieusement les logiciels à caractère micro-informatique et ceux à caractère macro-informatique.Interrogation de structuresEn synthèse de produits naturels, il peut être intéressant de chercher si certains blocs structuraux ne se trouvent pas dans des produits indépendants mais mieux connus. L’objectif est double: on cherche parfois si une propriété pharmacodynamique est associée à un fragment structural donné; d’autres fois, on cherche simplement si une synthèse efficace a été trouvée pour un bloc structural donné. Ainsi, dans la figure 2, on peut décider que l’ensemble cycle B plus la moitié du cycle C (celle qui apparaît en traits plus gras) constitue une unité structurale intéressante. Grâce aux programmes d’interrogation de sous-structure (promoteur: J.-É. Dubois), on peut interroger les banques de données en leur demandant: «Quels travaux ont déjà été publiés sur ce type de fragment structural?» La réponse couvrira tous les travaux résumés dans les Chemical Abstracts depuis 1965 (plus de six millions de structures).Le chimiste et les programmes de conception de synthèse assistéeDès la publication des travaux de Corey et Wipke, une question faussement prospective fit son apparition: «Peut-on imaginer un superprogramme unique articulé sur un fichier de réactions parfaitement à jour et dont la discrimination infaillible permettrait pour toute structure cible la proposition de voies de synthèse classées par ordre de mérite?» Cette question reflète la mauvaise évaluation courante du rôle de l’informatique dans l’activité humaine. On surestime généralement les pouvoirs de cette technique, ce qui la situe en position de compétition par rapport à l’homme alors qu’elle n’est qu’un outil remarquablement efficace. Cette évaluation fait beaucoup de mal: la fausse question précédente implique évidemment que, dans l’hypothèse d’une réponse positive, le chimiste se transforme en pur technicien au service de l’ordinateur. La situation devient alors clairement conflictuelle: le chimiste n’a de cesse de trouver des synthèses qu’aurait oubliées l’ordinateur et, à plus court terme, évite soigneusement tout échange constructif avec l’informaticien qui veut le dessaisir de son rôle de conception. Ce type de situation n’est pas nouveau et caractérise habituellement les rapports entre les scientifiques qui modélisent et ceux qui expérimentent.Bien que l’exposé des limites du traitement de conception assistée montre sans ambiguïté le rôle prépondérant que conservera le chimiste dans la synthèse de demain, il est intéressant de préciser ce point en rappelant l’histoire d’un autre domaine de la chimie. En 1958, la rencontre de la chimie théorique et des ordinateurs suscitait le même type de question: «Peut-on imaginer un superprogramme qui, partant des seules orbitales atomiques portées par chacun des atomes d’une molécule quelconque, permettrait de retrouver tous les observables associés à cette molécule?» Vingt ans après, cet objectif n’est pas encore atteint. Certains chimistes théoriciens se résolvent à diminuer la base des orbitales atomiques et acceptent d’adopter des modèles simplifiés. En contrepartie, ils se limitent à l’étude de familles de composés et de propriétés, plutôt que de chercher à rendre compte du comportement de toute molécule: cette approche a fourni des résultats remarquables sans mettre en œuvre d’énormes moyens de calcul. Néanmoins, elle est parfois fustigée par certains théoriciens qui se défient de l’empirisme. Si la même histoire recommençait avec la synthèse assistée par ordinateur, on retrouverait dans quelques années tout le spectre des castes qui divisent les chimistes théoriciens: à un extrême, quelques théoriciens chercheraient sans relâche l’ensemble d’algorithmes parfaits capables de transformer la synthèse chimique en un simple champ d’application des théories de l’intelligence artificielle; à l’autre bout, quelques chimistes «bricoleraient» sur de petites séries de composés une apparence de logique synthétique. L’application raisonnée des principes de l’informatique répartie au traitement de l’information chimique devrait contribuer à tracer la voie qui évitera les situations caricaturales.L’enjeu est d’importance: les services des Chemical Abstracts publient chaque année les résumés de publications relatives à la chimie et à ses applications réparties en 80 subdivisions. À partir de 1970, chacun de ces résumés est caractérisé par un profil de mots clés et placé sur bandes magnétiques; de nombreux index permettent d’interroger ces références directement en ligne. Cette information repose toutefois sur un simple inventaire de mots clés: il faut encore définir quels domaines de la chimie peuvent et doivent faire l’objet d’un traitement plus structuré. La synthèse organique et la détermination des structures ont les premières bénéficié de ce traitement du second ordre. Les Current Contents ont mis en route depuis 1979 une action intéressante: une équipe de chimistes dépouille chaque semaine la littérature scientifique mondiale et regroupe les réactions nouvelles ou les améliorations apportées à des réactions connues dans le fascicule Current Chemical Reactions . Le système D.A.R.C. (Description, Acquisition, Restitution, Conception) est un système mis au point par J.-É. Dubois, il permet de rechercher des informations concernant un composé dont on a décrit un élément de sa structure. Le système S.T.N. (Scientific and Technical International Network) dépendant des Chemical Abstracts permet également d’interroger un composé par sa structure. La Chemical Society (Londres) publie un périodique mensuel, Methods in Organic Synthesis , qui répond aux mêmes soucis. D’autres initiatives du même genre se multiplient. L’interface science-informatique est en pleine effervescence; les nations absentes de ce domaine risquent une bonne part de leur indépendance.Enseignement de la chimie et synthèse assistée par ordinateurLa simulation de synthèses par un groupe d’étudiants s’avère passionnante. L’ordinateur propose des chemins de synthèses pour obtenir un composé; à chaque proposition les étudiants se séparent en deux groupes, l’un qui «parie» que la proposition est chimiquement raisonnable, l’autre qui estime le contraire. Chaque groupe fournit les raisons de son choix et l’instructeur fournit la réponse motivée; les meilleurs joueurs sont ceux qui ont le plus souvent jugé sainement les différentes propositions. Les chemins les plus utilisés en synthèse sont ceux qui apparaissent le plus souvent et une hiérarchie des réactions en fonction de leur importance s’établit tout naturellement dans l’esprit du «joueur». On peut, à un stade ultérieur, orienter le jeu vers une recherche de créativité en retirant volontairement certaines réactions du fichier et en laissant le soin aux étudiants de retrouver certains chemins de synthèse que l’ordinateur a «oubliés».La pratique du jeu «simulation de synthèses» sur des structures aussi variées que possible recentre nécessairement l’attention sur la notion des structures chimiques importantes. En effet, lorsque l’étudiant prend conscience du nombre de voies à explorer pour reconstruire expérimentalement l’arbre de synthèse associé à une structure, l’évidence s’installe qu’il vaut mieux investir tout ce temps sur une structure utile à la société (santé, agriculture, énergie...).
Encyclopédie Universelle. 2012.